تحلیل خوشه بندی برای داده بیان ژن با استفاده از تجزیه ماتریس نامنفی

پایان نامه
چکیده

امروزه حجم عظیمی از مطالعات پزشکی در جهت شناسایی و درمان بیماری هایی است که از طریق ژن منتقل می شود. برای بررسی و نگهداری اطلاعات ژنتیکی، فناوری های مفیدی به وجود آمده است که یکی از ‎‎‎آن ها‏، فناوری ریزآرایه می باشد. تجزیه و تحلیل اطلاعات به دست آمده از ریزآرایه ها به کمک روش های داده کاوی انجام می شود. یکی از این روش ها خوشه بندی است که می تواند در یافتن گروه های واقعی و نهفته در داده ها موثر باشد. همچنین با استفاده از روش های کاهش بعد می توان مجموعه داده هایی با حجم کوچک تر از مجموعه داده های اصلی تولید کرد و آن را به عنوان ورودی روش خوشه بندی به کار برد. در این رساله از تجزیه ی ماتریس نامنفی‎‎‎‎ (nmf)‎ ‎‎ برای کاهش بعد داده های ریزآرایه استفاده می شود. همچنین برای مقداردهی اولیه این تجزیه روش های تصادفی‏، تحلیل مولفه اصلی ‎(‎pca)‎‎ و تجزیه ی مقدار تکین مضاعف نامنفی ‎(‎nndsvd)‎‎ به کار می رود. پس از آن با ‎‎‎به کارگیری روش ‎$ ‎k‎ $‎-متوسط داده های کاهش یافته‏ خوشه بندی می گردد. تحلیل های انجام شده در این تحقیق نشان می دهد که ‎خوشه بندی داده های حاصل از nmf+pca نتایج بهتری را ارائه می دهد‎.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تجزیۀ نامنفی ماتریسی: روشی برای تحلیل داده های نامنفی

اخیراً روش جدیدی با نام تجزیۀ نامنفی ماتریسی برای نمایش خطی داده های نامنفی پیشنهاد شده است که علاوه بر کاهش تعداد داده ها، محدودیت روش های کلاسیک را ندارد. در این روش، ماتریس بزرگِ متناظر با  داده های نامنفی به دو ماتریس نامنفی کوچک تجزیه می شود. در این مقاله، ابتدا روش های کلاسیک را مرور می کنیم. سپس تجزیۀ نامنفی ماتریسی با نسخه های مختلف آن معرفی و مسائل مهم داده کاوی مانند رده بندی و خوشه بند...

متن کامل

خوشه بندی خودرو سازان بر اساس تابع تولید اقتصادی با استفاده از تحلیل پوششی داده ها

  خوشه بندی به کمک تحلیل پوششی داده ها(DEA) شناسایی روابط پنهان بین عوامل ورودی و خورجی واحدهای تصمیم گیری در تعیین تابع تولید آنهاست.در این مقاله به کمک خوشه بندی بر اساسDEA توابع تولید واحدهای تصمیم گیری صنایع خودرو سازی(از جمله سایپا) به صورت تفکیک شده مشخص می شود.تعیین توابع تولید خودروسازان و استفاده از انها در تفکیک صنایع مشابه با قابلیت در نظر گرفتن همزمان چندین عامل ورودی و خروجی از مز...

متن کامل

تجزیۀ نامنفی ماتریسی: روشی برای تحلیل داده های نامنفی

اخیراً روش جدیدی با نام تجزیۀ نامنفی ماتریسی برای نمایش خطی داده های نامنفی پیشنهاد شده است که علاوه بر کاهش تعداد داده ها، محدودیت روش های کلاسیک را ندارد. در این روش، ماتریس بزرگِ متناظر با  داده های نامنفی به دو ماتریس نامنفی کوچک تجزیه می شود. در این مقاله، ابتدا روش های کلاسیک را مرور می کنیم. سپس تجزیۀ نامنفی ماتریسی با نسخه های مختلف آن معرفی و مسائل مهم داده کاوی مانند رده بندی و خوشه بند...

متن کامل

تجزیه نامنفی ماتریس

تجزیه نامنفی ماتریس روش بسیار مفیدی برای تقریب داده های با ابعاد بالاست که دارای مولفه های نامنفی هستند. این تجزیه در زمینه های بسیاری چون یافتن بردارهای پایه تصویر، خوشه بندی اسناد متنی و غیره کاربرد دارد. در این پایان نامه به بررسی برخی از الگوریتم های موجود برای آن از جمله روش تصویر گرادیان، روش نقطه درونی بر مبنای گرادیان و روش تصویر یکنواخت برزیلای ـ بوروین بر اساس چارچوب کمترین مربعات نام...

طبقه بندی و خوشه بندی دودویی ژن ها با استفاده از روش های بهترین جفت و تجزیه ی ماتریس دودویی

فناوری ریزآرایه ی dna دارای آثار شگرفی در تحقیقات سرطان می باشد و داده های بیان ژن ریزآرایه، برای تشخیص ویژگی های ژنتیکی سرطان کاربرد وسیعی دارد، که می تواند به منظور افزایش دقت تشخیص سرطان و پیش بینی بیماری استفاده گردد. البته در مطالعات مختلف به دلیل محدودیت اندازه ی نمونه ها، اغلب هم پوشانی محدودی بین ویژگی های ژن هایی که برای تشخیص سرطان ها بدست آمده وجود دارد. استفاده از داده ی ریزآرایه، م...

تجزیه نامنفی ماتریس و کاربرد آن در پردازش داده ها

تجزیه نامنفی ماتریس nmf از موضوعات به روز در زمینه جبرخطی است که برای تشخیص الگو، تحلیل داده ها و کاهش بعد به کار می رود. در این حوزه هدف، تجزیه ماتریس a شامل داده های نامنفی به حاصل ضرب ماتریس پایه u و ماتریس ضرایب v^t با درایه های نامنفی است. در حالت کلی نیاز به تحلیل و استخراج ویژگی ما را خود به خود به سمت کاهش بعد و فشرده سازی سوق داده است. این عمل برای کاهش هزینه ذخیره سازی اطلاعات و یا اس...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه یزد

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023